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摘 要 : 以 哈萨克 斯 坦 北部 雨 养 耕作 区 为 研究 靶 区 ,基于 春小麦 产量 统计 数据 和 还 感 光谱 指数 ， 
展 了 春小麦 估 产 最 优 预测 时 期 及 植被 指数 分 析 , 采 用 回归 分 析 、 随 机 森林 、 支 持 向 量 机 及 双向 循环 
神经 网 络 模型 估算 春小麦 产量 ,并 对 比分 析 了 不 同 模型 的 模拟 精度 。 结 果 表 明 : 北 哈萨克 斯 坦 州 、 
阿 克 莫 拉 州 和 库 斯 塔 纳 州 2007 一 2016 年 春小麦 估 产 的 最 佳 预测 时 期 为 6 月 26 日 一 8 月 5 日 ,该 时 


期 是 春小麦 产量 形成 的 关键 时 期 。 北 哈萨克 斯 坦 州 春小麦 估 产 最 优 植被 指数 为 7 月 12 日 的 绿 度 
叶绿素 指数 (Green chlorophyll index, Clee) , 阿 克 莫 拉 州 春小麦 估 产 最 优 植被 指数 为 8 月 5 日 的 绿 
度 动态 宽 波 段 指数 (Green wide dynamic range vegetation index, WDRV Ipen) , 库 斯 塔 纳 州 春小麦 最 优 
估 产 植被 指数 为 7 月 12 日 的 WDRVIses。 对 比分 析 4 种 模型 模拟 春小麦 产量 的 精度 ,在 样本 点 较 少 
的 情况 下 ,双向 循环 神经 网 络 模 型 相 比 其 他 模型 在 估算 哈萨克 斯 坦 北部 三 州 春小麦 产量 上 精度 较 
高 ;春小麦 产量 与 植被 净 初 级 生产 力 NPP 相关 性 分 析 结 果 显 示 , 北 哈萨克 斯 坦 州 、 阿 克 英 拉 州 和 库 


斯 塔 纳 州 决定 系数 屁 在 0.50 以 上 


面积 占 比 分 别 为 44% .94% 和 77% ,表明 上 述 估 产 模型 可 应 用 于 哈 


萨克斯 坦 北部 三 州 春小麦 估 产 ,尤其 是 阿 克 莫 拉 州 和 库 斯 塔 纳 州 。 
关 键 词 : 雨 养 小 麦 耕 作 区 ; 遥感 估 产 ; 植被 指数 ; 回归 模型 ; 机 器 学 习 ; 哈萨克 斯 坦 北部 


文章 编号 : 


哈萨克 斯 坦 的 面粉 出 口 量 位 于 世界 第 一 ,被 称 
作 中 亚 粮 仓 ,其 北部 地 区 的 北 哈萨克 斯 坦 州 、 阿 克 
英 拉 州 和 库 斯 塔 纳 州 是 世界 重要 的 小 麦 和 面粉 输 
出 地 ,小 麦 的 种 植 结 构 比 例 达 到 86% 以 上 ,2010 年 
以 来 ,其 小 麦 和 大 麦 产量 居 世 界 第 12 位 ,出 口 量 居 
世界 第 5 位 "。 在 中 亚 的 其 他 国家 ,由 于 经 济 作物 
E ERK ,种植 结构 不 合理 旦 耕地 面积 有 限 ,严重 
限制 了 各 国 的 粮食 生产 能 力 ,每 年 都 需要 癌 哈 萨 到 
斯 坦 进口 大 量 小 麦 , 才 能 满足 国家 粮食 需求 "。 近 
年 来 ,中 亚 各 国 的 人 口 增长 速度 与 粮食 产量 增产 速 
度 严 重 失衡 ,作为 发 展 中 国家 ,中 亚 各 国 经 济 发 展 
水 平 本 身 较 低 ,难以 应 付 国际 粮 价 上 涨 和 国家 本 刁 
购买 力 低下 带 来 的 一 系列 社会 问题 ”>。 及 时 准确 估 
算 哈 萨克斯 坦 北部 春小麦 产量 ,可 为 当地 政府 部 门 
春小麦 生产 管理 提供 重要 的 参考 价值 ,对 维护 区 域 
粮食 安全 亦 起 着 不 可 忽视 的 作用 。 
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作物 佑 产 的 方法 可 以 归纳 为 传统 作物 估 产 和 
遥感 作物 估 产 两 大 类 ”。 传 统 作 物 估 产 ,一 般 采 取 
区 域 人 工 调查 手段 ,结合 农学 、 气 象 学 ,采用 统计 学 
方法 建立 作物 估 产 模式 ,该 方法 费时 、 费 力 且 不 利 
于 动态 时 空 监测 ” 。 现 代 遥 感 技术 的 发 展 , 为 区 域 
粮食 佑 产 及 动态 监测 提供 了 有 效 的 手段 “”。 遥 感 
作物 估 产 方法 主要 包括 经 验 模型 机 器 学 习 " 中” 
和 机 理 模 型 ”三 大 类 ,其 中 ,经 验 模 型 法 是 利用 遥 
感 卫 星 对 作物 冠 层 反射 的 电磁 波 信 息 ,计算 表征 植 
被 特征 的 多 个 植被 指数 ,通过 与 作物 的 实际 产量 建 
立 经 验 模 型 ,寻找 估算 作物 产量 的 最 优 植被 指数 ， 
从 而 提高 作物 估 产 精度 。 例 如 Bolton 等 "5 利用 MO- 
DIS 产品 计算 2 波段 增强 型 植被 指数 (Enhanced veg- 
etation index 2, EVI2) 和 归 一 化 水 体 指数 (Normal- 
ized difference water index, NDWI) ,并 利用 该 指数 估 
算 了 美国 中 部 玉米 和 大 豆 产 量 ,发 现在 玉米 返青 后 
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的 65~75 d 和 大 豆 返 青 后 的 80 d 左 右 , 植 被 指数 与 
作物 产量 相关 性 最 高 。Leroux 等 "以 非洲 萨 赫 勒 地 
区 为 研究 区 ,利用 MODIS 归 一 化 植被 指数 (Normal- 
ized difference vegetation index, NDVI) 、 地 表 温 度 
(Land surface temperature, LST) WIRA! SARRA- 
也 模拟 的 地 表 生 物 量 和 收获 指数 建立 经 验 统计 模型 
估算 作物 产量 ,结果 发 现 组 合 后 的 指数 在 估算 产量 
上 优 于 单独 基于 NDVI 模型 。 郭 锐利 用 10 a 的 
MOD09A1 和 MOD16A2 产 品 计算 了 增强 型 植被 指数 
(Enhanced vegetation index, EVI) 和 作物 水 分 胁迫 指 
数 (Crop water stress index, CWSI) 估 算 了 山东 省 和 
各 市 级 尺度 的 冬小麦 产量 ,其 估算 精度 均 不 低 于 
89.41% 。 此 外 , 近 些 年 来 ,机 融 学 习 模型 在 遥感 作 
物 佑 产 方面 得 到 广泛 应 用 ,其 主要 包括 随机 森林 、 
文 持 问 量 机 神经 网 络 等 。 安 秦 “在 长 春 地 区 结合 
HJ-1A/B 和 Landsat 8 2 种 卫星 影像 数据 计算 了 4 种 
植被 指数 ,通过 对 比 曲线 统计 、 多 元 逐步 回归 、 偏 最 
小 二 乘 回 归 和 神经 网 络 模型 ,发 现 神经 网 络 建立 的 
估 产 模型 在 稳定 性 和 精度 性 方面 更 高 。 曾 妍 等 ” 
利用 MODIS 产 品 计算 了 条 件 温度 植被 指数 (Vegeta- 
tion temperature condition index, VTCI) 和 叶 面 积 指 
数 (Leaf area index, LAI) ,通过 支持 向 量 回 归 模 型 佑 
算 了 关中 平原 冬小麦 产量 ,模型 决定 系数 达 0.88。 
机 理 模型 作物 佑 产 是 依据 作物 的 生理 生长 特征 , 考 
虑 作物 的 光合 和 呼吸 作用 ,并 考虑 作物 生长 的 环 
境 ,例如 气温 .降水 .土壤 肥力 等 因素 ,模拟 作物 的 
生长 过 程 , 同 时 将 遥感 数据 与 作物 模型 有 效 结合 ， 
从 而 实现 对 作物 产量 的 预测 ,例如 WOFOST、AP- 
SIM, DSSAT CASA 模型 等 。 例 如 黄 健 申 等 "对比 
T LAI MIZŠ AK ( Evapotranspiration, ET) 在 同化 前 和 同 
化 后 融合 到 SWAP 作物 模型 中 进行 估算 冬小麦 产 
量 ,发 现 同化 后 的 精度 比 同化 前 高 出 31% 左 右 。 同 
时 马 鸿 元 等 中 还 以 WOFOST 为 动态 模型 ,采用 集合 
卡尔 曼 滤波 同化 算法 ,研发 了 一 种 遥感 LAI 与 作物 
模型 同化 的 区 域 冬小麦 产量 系统 。 尽 管 机 理 模 型 
虽然 功能 强大 ,但 所 需 参 数 较 多 ,模型 计算 量 大 ,对 
计算 机 能 力 要 求 高 ,本 地 参数 耗 时 耗 力 ,并 且 依 赖 于 
站 点 数据 ,因此 在 无 站 点 数据 区 域 难 以 推广 ”。 
哈萨克 斯 坦 北 部 地 区 缺乏 气象 观测 站 点 数据 
和 详细 的 土壤 数据 ,因此 难以 利用 作物 生长 模型 进 
行 春小麦 产量 估 测 。 经 验 模型 应 用 较为 广泛 ,其 主 
要 是 通过 建立 单一 植被 指数 或 者 多 植被 指数 的 组 
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合 与 作物 实际 产量 构建 线性 或 者 非 线性 方程 ,比较 
其 相关 性 ,最终 筛选 出 最 佳 的 产量 预测 模型 ,但 这 
种 常规 模型 不 一 定 能 满足 估 测 小 麦 产 量 的 精度 要 
求 。 机 器 学 习 相 比 常规 模型 ,有 其 独特 优势 ,例如 
善于 处 理 高 维 变量 和 对 变量 间 的 线性 和 非 线 性 关 
系 有 着 极 强 的 学 习 能 力 ,以 广泛 应 用 于 地 理学 的 研 
究 当 中 中 。 尽 管 部 分 小 麦 估 产 的 研究 中 涉及 了 机 
器 学 习 模 型 ,但 往往 仅 是 一 种 机 器 学 习 模型 ,很 少 
研究 将 多 种 机 需 学 习 模 型 与 常规 方法 进行 对 比 研 
究 , 且 在 哈萨克 斯 坦 北部 地 区 很 少 有 关于 春小麦 产 
量 的 研究 报道 。 本 人 研究 基于 MODIS 遥感 数据 产品 
和 作物 产量 统计 数据 ,采用 经 验 模型 及 机 器 学 习 
法 ,利用 线性 回归 、 随 机 森林 、 神 经 网 络 和 支持 向 量 
机 模型 ,对 比分 析 了 10 种 植被 指数 估 测 春小麦 产量 
的 能 力 ,评估 春小麦 最 佳 估 产 时 间 、 最 优 植被 指数 
及 估 产 模型 ,以 期 为 当地 春小麦 生产 提供 管理 
依据 。 


1 研究 区 概况 


哈萨克 斯 坦 北部 区 域 包括 北 哈萨克 斯 坦 州 JE 
斯 塔 纳 州 和 阿 克 葛 拉 州 (图 1) ,位 置 介 于 60?03'~ 
74°16' 慷 ,48°09'~55°25'N'" 。 该 区 域 为 温带 大 陆 性 
气候 ,夏季 降水 集中 ,冬季 寒冷 漫长 ””。 冬 季 的 平 
均 气 温 在 -15~ -20 ,最 低 可 达 -30 % ,夏季 平均 气 
温 18~25 % ,最 高 可 达 30 %。 北 哈萨克 斯 坦 州 年 平 
均 降 水 量 为 407 mm, 库 斯 塔 纳 州 年 平均 降水 量 为 
353 mm, 阿 克 莫 拉 州 年 平均 降水 量 为 381 mmo (F 
希 姆 河和 托 博 尔 河 流 经 哈萨克 斯 坦 北 部 。 北 哈 节 
克 斯 坦 州 有 众多 湖泊 ,都 为 淡水 湖 。 主 要 的 植被 类 
型 为 草地 耕地、 建筑 用 地 森林、 裸 地 和 水 体 ,分 别 
约 占 总 面积 的 36%、50%、1%、1%、10% 和 2%。 该 地 
区 土壤 以 黑色 土 . 棕 色 土 为 主 , 土 壤 肥 沃 地 势 平 坦 ， 
是 世界 上 重要 的 小 麦 出 口 输出 地 ,由 于 该 地 区 农田 
为 雨 养 田 , 受 降水 影响 大 ,导致 产量 极 不 稳定 3。 


2 数据 与 方法 


2.1 数据 来 源 与 处 理 

哈萨克 斯 坦 北 部 耕作 区 矢量 数据 由 中 国 科 学 
院 地 球 大 数据 科学 工程 (CASEarth ) 专 项 提供 (http:/ 
data.casearth.en/) ,数据 生产 者 为 中 科 院 新 疆 生 态 与 
地 理 研 究 所 遥感 研究 团队 ,该 数据 集 以 Landsat 遥 感 
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注 :该 图 基于 


>) 耕地 (16.35%) 森林 (0.10%) E 建筑 用 地 (0.70%) 
EE 草地 (34.60%) MM 水 体 (2.16%) E 其 他 用 地 (46.09%) 


(下 载 网 址 :http://zwfw.ch.mnr.gov.cn/index ) , 底 图 边界 无 修改 。 下 同 。 
图 1 哈萨克 斯 坦 北部 地 理 位 置 及 土地 利用 类 型 


Fig. 1 Location and types of land use in northern Kazakhstan 


然 资 源 部 地 图 、 省 级 自然 资源 厅 技 术 审 查 中 心 下 载 的 标准 地 图 审 图 号 为 GS(2016)2948 号 制作 


影像 为 数据 源 ,采用 面向 对 象 的 遥感 分 类 方法 ,应 
用 影像 分 割 .决策 树 分 类 ,变化 监测 等 关键 技术 解 
译 获 得 ,数据 精度 达到 93% 以 上 2 。 计 算 植 被 指数 
所 使 用 的 遥感 产品 是 2007 一 2016 年 每 年 6 一 8 月 每 
8d 的 MOD09A1l 和 MOD15A2H 数 据 集 ,其 分 辩 率 为 
500 m。 小 麦 估 产 采用 2007 一 2016 年 的 植被 净 初 级 
生产 力 MOD17A3HGF 产品 进行 间接 验证 2。 利 用 
Google Earth Engine (GEE) Æ 台 ,对 MOD09A1、 
MOD15A2H 和 MOD17A3HGF 产品 进行 预 处 理 , HE 
取 优 质 像 元 ,以 减少 云 污 染 对 数据 质量 的 影响 。 
2.2 植被 指数 计算 

选用 在 作物 佑 产 和 估算 生物 量 方面 应 用 频率 
较 高 的 10 种 植被 指数 进行 最 优 植 被 指数 分 析 。 哈 
萨克斯 坦 北部 春小麦 的 播种 日 期 自 5 月 初 开 始 ,8 月 
底 到 9 月 初 进行 春小麦 收割。 因此 ,利用 GEE 平 台 ， 
下 载 了 春小麦 关键 生长 期 6 月 2 日 一 8 月 30 日 每 8 
d 的 MOD15A2H 叶 面 积 指数 产品 ,并 利用 MODO09A1l 
产品 计算 了 在 此 日 期 内 每 8d 的 其 余 9 种 植被 指数 ， 
对 哈萨克 斯 坦 北 部 三 州 春小麦 进行 动态 监测 。9 种 
植被 指数 计算 公式 如 表 1 所 示 。 
2.3 确定 最 优 植被 指数 和 最 佳 预 测 时 间 

通过 利用 哈萨克 斯 坦 北 部 三 州 春小麦 实际 产 


量 与 哈萨克 斯 坦 北 部 三 州 耕作 区 植被 指数 平均 值 
进行 线性 拟 合 ,利用 决定 系数 (RR) 和 均 方 根 误差 
(RMSE ) 作 为 选择 最 优 植被 指数 和 最 佳 预 测 时 间 的 
依据 。 


RMSE= /- 


式 中 : x,y, 分 别 为 冬小麦 单产 的 预测 值 和 实际 值 
(kg"hm”); N 为 年 数 。 
2.4 春小麦 估 产 模型 

基于 最 佳 的 植被 指数 和 预测 时 间 ,分 别 使 用 回 
归 ,随机 森林 、 文 持 向 量 机 和 双向 循环 神经 网 络 模型 
对 哈萨克 斯 坦 北 部 三 州 进行 春小麦 产量 估 测 下 。 由 
于 本 文 所 使 用 的 样本 量 较 少 ,因此 使 用 Bootstrap 抽 
样 方法 ,Bootstrap 是 一 种 有 放 回 的 均匀 抽样 , 它 将 数 
据 集中 的 NN 个 样本 数据 ,有 放 回 的 随机 抽取 NN 个 样 
本 形成 新 的 训练 集 ,利用 未 抽 到 的 样本 作为 验证 数 
据 集 ”。 基 于 本 文 的 样本 数量 ,数据 集 循环 抽样 50 
次 进行 模型 训练 ,优化 机 带 学 习 下 的 各 重要 参数 。 
各 州 选 出 的 最 佳 植被 指数 和 预测 时 间作 为 模型 输 
入 ,模型 输出 为 春小麦 产量 。 由 于 本 文 所 使 用 的 是 
单 变量 ,所 以 在 随机 和 森林 模型 中 不 对 最 佳 变 量 个 数 
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表 1 植被 指数 公式 


Tab.1 Vegetation index formulas 


植被 指数 公式 参考 文献 
NDVI NDVI=(p, -pi)/(p;+p)) 28-30] 
EVI2 EVI2=[2.5 x (p,—p,)]/(p, + 2.4 Xp, + 1) 31] 
WDRVI WDRVI=(eXp,-p)/(eXp, +p), a 取 值 为 0.1 32] 
i ae m | Novica a a 
WDRVI,.., WDRVI,., =[(@Xp.-p(axp, +p,)|+[(1-a)/(L +] a 取 值 为 0.3 34] 

[0 Cl, =(P) -1 35] 
DVI DVI =p, -P, 36] 
OSAVI OSAVI=(1 +1.16) x[(p, -p,)/(p, +p, + 0.16) | 37] 
NMDI NMDI=[p, = (Ps =P) /[P2 + (Ps =P7)] 8] 

注 :NDVI 为 归 一 化 植被 指数 ;EVI2 为 2 波段 增强 型 植被 指数 ;WDRVI 为 宽 动态 范围 植被 指数 ;SANDVI 为 饱和 校正 NDVI 指 数 ;WDRVIswo 为 


绿 度 动态 宽 波段 指数 ;Cl 为 绿 度 叶绿素 指数 ;DVI 为 差 值 植被 指数 ;OSAVI 为 优化 土壤 校正 植被 指数 ;NMDI 为 归 一 化 多 波段 干旱 指数 ; 
Pi > Pa v Pas ps 和 pj 分 别 为 MOD09A1l 产 品 中 的 红 波 段 、 近 红外 波段 、 绿 波段 ,短波 红外 1 和 短波 红外 2 波段 ; a 为 校正 系数 ;RVI 为 比值 植被 


指数 。 下 同 。 


进行 训练 ,而 对 回归 树 的 个 数 进行 训练 。 支 持 向 量 
机 的 核 隐 数 选择 线性 函数 ,主要 对 其 代价 函数 进行 
训练 。 双 向 循环 神经 网 络 主要 调整 神经 元 个 数 , 利 
用 验证 数据 集 的 RMSE 决 定 最 佳 的 模型 参数 ,RMSE 
越 小 ,模型 估算 的 春小麦 产量 精度 越 高 。 


3 BRAD 


3.1 哈萨克 斯 坦 北部 春小麦 估 产 最 优 植被 指数 及 
最 佳 估 产 日 期 
基于 多 波段 的 MOD09A1 和 叶 面 积 指数 MOD 


16A2 产品 每 8 d 的 光谱 信息 ,计算 哈萨克 斯 坦 北部 
三 州 耕作 区 植被 指数 ,利用 一 元 线性 回归 模型 拟 合 
作物 产量 ,期 望 找 出 最 优 植 被 指数 和 最 佳 估 产 
日 期 。 

图 2a 和 表 2 显 示 , 归 一 化 多 波段 干旱 指数 (Nor- 
malized multi-band drought index, NMDI) 与 春小麦 产 
量 在 三 州 的 拟 合 效果 表现 较 差 。2007 一 2016 年 6 月 
2 日 一 8 月 30 日, 北 哈 萨克斯 坦 州 各 植被 指数 与 春 
小 麦 产 量 尺 表现 为 先 升 高 后 降低 ,最 优 植 被 指数 为 
7 月 12 日 左右 的 Clswo,R 系 数 达到 0.83, 其 P 值 小 于 


(a) 北 哈萨克 斯 坦 州 (b) 阿 克 莫 拉 州 (c) 库 斯 塔 纳 州 
0.8 
p = 0.8 
juny juny 
0.6 
= T 0.6 
R 04 R 0.4 
jang jony 
0.2 0.2 
0.0 0.0 
SQ AN EX 
soe Fe 
植被 指数 


注 :LAI HIFA 


积 指数 ;SANDVI 为 饱和 校正 NDVI 指 数 ;WDRVI 为 宽 动态 范围 植被 指数 ;NDVI 为 归 一 化 植被 指数 ; 


EVI2 为 2 波段 增强 型 植被 指数 ;Cl 为 绿 度 叶绿素 指数 ;DVI 为 差 值 植被 指数 ;WDRVIs. 为 绿 度 动态 宽 波段 指数 ; 
OSAVI 为 优化 土壤 校正 植被 指数 ;NMDI 为 归 一 化 多 波段 干旱 指数 ;让 为 决定 系数 。 


图 2 哈萨克 斯 坦 北 部 植被 指数 和 春小麦 单产 决定 系数 


Fig. 2 Coefficient of determination between the vegetation index and the yield per unit of spring wheat in northern Kazakhstan 
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表 2 了 哈萨克 斯 坦 北部 最 优 植被 指数 及 最 佳 估 产 日 期 


Tab. 2 Optimal vegetation index and best estimated date of spring wheat yield in northern Kazakhstan 


地 名 最 优 植被 指数 (排名 前 5 位 ) 最 佳 观测 日 期 (月 -日 ) R RMSE/kg 
北 哈萨克 斯 坦 州 lra 07-12 0.83 131.8 
LAI 07-12 0.82 135.5 
LAI 06-26 0.80 143.0 
DVI 07-12 0.77 153.6 
OSAVI 07-12 0.76 155.3 
阿 克 莫 拉 州 WDRVI 08-05 0.80 137.5 
EVI2 07-12 0.78 143.9 
LAI 07-12 0.77 145.0 
WDRVI 07-12 0.76 147.6 
EVI2 07-20 0.76 148.2 
库 斯 塔 纳 州 WDRVI 07-12 0.88 123.6 
OSAVI 07-12 0.83 150.7 
Cleon 07-12 0.81 157.5 
DVI 07-12 0.81 158.2 
LAI 06-26 0.80 163.7 


注 : 尼 为 决定 系数 ;RMSE 为 均 方 根 误差 。 


0.001,RMSE 为 131.8 kg。 其 次 是 6 月 26 日 和 7 月 12 
H ÉJ LAT, 与 春小麦 产量 尼 都 大 于 或 等 于 0.80, 忆 值 
都 小 于 0.001,RMSE 分 别 是 143.0 kg 和 135.5 kgo 在 
北 哈萨克 斯 坦 州 ,春小麦 最 早 可 以 利用 6 月 26 日 的 
LAI 指 数 进行 春小麦 估 产 。 

图 2b 和 表 2 结 果 表明 , 除 NMDI 以 外 ,6 月 26 H 
以 后 其 他 植被 指数 与 春小麦 产量 尼 在 阿 克 葛 拉 州 
开始 迅速 增加 ,8 月 21 日 之 后 尺 系数 普遍 下 降 ,总 体 
来 看 ,7 月 4 日 一 8 月 5 日 植被 指数 与 春小麦 产量 相 
关 性 较 好 ,而 6 月 18 日 以 前 各 指数 与 春小麦 产量 相 
关 性 不 佳 。 与 春小麦 单产 拟 合 最 好 的 植被 指数 是 
WDR Vereen, 最 佳 预测 时 间 在 8 月 5 日 前 后 , 尺 为 
0.80,P 值 小 于 0.001,RMSE 为 137.5 kg。 此 外 ,在 阿 
克 葛 拉 州 ,春小麦 估 产 最 早 可 以 在 7 月 12 日 左右 进 
行 , 宽 动态 范围 植被 指数 (Wide dynamic range vege- 
tation index, WDRVI) , LAI 和 EVI2, R° fib #8 it 0.75, 
RMSE 分 别 为 147.6 kg 145.0 kg FI 143.9 kgo 

从 图 2c 和 表 2 表 明 , 库 斯 塔 纳 州 在 6 月 10 日 以 
前 和 8 月 13 日 以 后 ,各 指数 对 春小麦 产量 拟 合 性 较 
差 ,敏感 性 低 。6 月 26 日 一 7 月 28 日 为 春小麦 产量 
预测 最 佳 时 期 ,7 月 12 日 各 指数 对 春小麦 产量 的 敏 
感性 达到 最 高 ,大 部 分 指数 P 值 小 于 0.001。 其 中 ， 
WDRVIs 与 春小麦 产量 在 7 月 12 日 相关 性 较 强 ,RR 
H 0.88 , P (H/F 0.001 , RMSE 为 123.6 kg。Cl、 差 


值 植被 指数 (Difference vegetation index, DVI) 和 优化 
土壤 校正 植被 指数 (Optimized soil adjusted vegeta- 
tion index, OSAVI1) 与 春小麦 产量 尺 在 7 月 12 日 都 大 
于 或 等 于 0.81,P 值 小 于 0.001,RMSE 分 别 为 157.5 
kg、158.2 kg 和 150.7 kg。 在 库 斯 塔 纳 州 ,春小麦 最 早 
可 以 在 6 月 26 日 前 后 利用 LAI 指 数 进行 春小麦 估 产 。 

经 对 比分 析 , 北 哈萨克 斯 坦 州 春小麦 产量 预测 
最 佳 日 期 为 7 月 12 日 ,最 优 植被 指数 为 CI, 阿 克 
莫 拉 州 春小麦 产量 预测 最 佳 日 期 为 8 月 5 日 ,最 优 
植被 指数 为 WDRVI, 库 斯 塔 纳 州 春小麦 产量 预测 
最 佳 日 期 为 7 月 12 日 ,最 优 植被 指数 为 WDRVIs.。 
3.2 哈萨克 斯 坦 北部 耕作 区 春小麦 估 产 最 优 模型 
及 空间 分 布 特征 

利用 线性 回归 、 随 机 和 森林、 支持 向 量 机 和 神经 
网 络 模型 对 哈萨克 斯 坦 北 部 三 州 耕 作 区 进行 春 小 
麦 产量 估 测 ,以 期 找 出 最 佳 的 产量 预测 模型 。 图 3 
AR FW ArcGIS 自然 间断 点 进行 分 类 ,结果 表明 ,在 北 
哈萨克 斯 坦 州 利用 线性 回归 支持 癌 量 机 和 神经 网 
络 模型 模拟 出 的 产量 在 空间 分 布 特征 上 相似 性 较 
高 ,随机 森林 模型 模拟 的 春小麦 高 产 区 分 布 较为 离 
散 ,聚集 性 不 强 ,在 西部 和 东南 部 低产 区 分 布 较 
多 。 总 体 而 言 ,4 种 模型 模拟 的 春小麦 产量 在 东南 
部 地 区 相对 较 低 ,中 北部 地 区 较 高 。 在 阿 克 莫 拉 
州 ,支持 向 量 机 模型 在 南部 模拟 的 产量 分 布 上 出 现 
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(a2) 北 哈萨克 斯 坦 州 
随机 森林 模型 


人 


0 100km 
图 例 os 
一 国 边 界 


一 州 边界 国 0~1250 m 1370~1430 


产量 kg ” 国 540~790 E 1150~1350 产量 /kg 。 国 1250~1310 Œ 1430~1520 
口 0 E 790~980 E 1350~1990 口 0 E 1310~1370 m 1520~1800 
(b1) 阿 克 莫 拉 州 (b2) 阿 克 莫 拉 州 
回归 模型 随机 森林 模型 


人 


图 例 0 112.5km 图 例 0 112.5km 
一 州 边界 一 州 边界 
0~484 750~894 m 0~780 m 930~1015 
产量 kg m 484-420 - 894-1077 产量 /kg m 780~850 目 1015~1130 
口 0 国 620~750 E 1077~1474 口 0 m 850~930 W 1130~1350 
(c1) 库 斯 塔 纳 州 (c2) 库 斯 塔 纳 州 
回归 模型 随机 森林 模型 
A À 
0 160km 0 160km 
图 例 图 例 
= 一 国 边界 
一 Ha Ai 
产量 起 m 920~1130 产量 /kg E 1085~1210 
口 0 m 440~700 m 1130~1350 口 0 目 865~972 E 1210~1340 


E 0~440 E 700~920 E 1350~1724 


m 0~865 © 972~1085 M 1340~1560 


(a3) 北 哈萨克 斯 坦 州 
支持 向 量 机 模型 
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(a4) 4 a 州 
神经 网 


N 


A 


0 100km 0 100km 
一 国 边界 一 国 边界 
一 州 边界 m 0-420 wm 920~1100 一 州 边界 m 0~942 国 1181~1295 
产量 /kg m 420~700 m 1100~1250 ”产量 kg m 942~1071 E 1295~1445 
口 0 目 700~920 Œ 1250~1615 口 0 E 1071~1181 m 1445~1990 
(b3) 阿 克 莫 拉 州 (b4) 阿 克 莫 拉 州 
支持 向 量 机 模型 神经 网 络 模型 


一 州 边界 四 0-820 目 900-950 INAR 目 0-595 m 753-880 
产量 /kg 目 820~860 m 950~1015 ”产量 /kg m 595~665 E 880~1030 
口 0 m 860-900 m 1015~1100 0 0 目 665~753 加 1030~1350 
(c3) 库 斯 塔 纳 州 (c4) 库 斯 塔 纳 州 
支持 向 量 机 模型 神经 网 络 模型 
人 人 
0 160km 0 160km 
图 例 图 例 
一 国 边界 一 国 边界 
州 边界 州 边界 
产量 /kg m 1160~1230 产量 /kg E 1045~1210 
口 0 目 1050~1110 目 1230-1300 O0 m 730~890 E 1210~1390 


m 0~1050 Æ 1110~1160 W 1300~1460 


m 0~730 Œ 890~1045 E 1390~1653 


注 : 图 中 空白 区 域 为 无 小 麦 耕作 区 。 下 同 。 
3 2007 一 2016 年 哈萨克 斯 坦 北 部 多 年 平均 估算 春小麦 产量 


Fig. 3 Estimated annual average production of spring wheat yield in northern Kazakhstan from 2007 to 2016 


破碎 化 特征 ,并 且 支 持 向 量 机 模型 佑 算 的 产量 区 域 
差异 较 小 。 除 支持 向 量 机 模型 外 ,其 他 3 种 模型 模 
拟 的 春小麦 产量 在 阿 克 莫 拉 州 的 北部 相 较 于 其 他 
区 域 产 量 较 高 ,东部 和 南部 地 区 春小麦 产量 较 低 ， 
回归 模型 和 随机 森林 模型 模拟 的 产量 在 空间 分 布 


数 来 估算 作物 产量 ” 。 由 于 本 研究 春小麦 产量 统 
计数 据 有 限 , 且 主 要 用 于 模型 输入 参数 , 故 为 评价 
春小麦 估 产 模型 的 优 劣 ,研究 分 析 不 同 模型 模拟 春 
小 麦 产 量 与 NPP(MOD17A3HCF) 之 间 的 相关 性 ,期 
望 找 出 最 佳 产量 估 测 模型 (图 4) ,并 对 各 州 NPP 与 


上 相似 性 较 高 。 在 库 斯 塔 纳 州 ,4 种 模型 估算 的 春 
小 麦 产量 空间 分 布 特征 具有 较 高 的 相似 性 且 产 量 
表现 为 北部 较 高 ,南部 较 低 。 同 样 文 持 向 量 机 模型 
模拟 的 产值 区 域 性 差异 较 小 。 综 合 上 述 分 析 ,尽管 
模型 之 间 有 所 差别 ,但 模拟 的 春小麦 产量 在 空间 分 
布 特征 上 具有 一 致 性 ,通过 对 比 发 现 ,随机 森林 模 
型 和 支持 癌 量 机 模型 模拟 的 春小麦 产量 在 三 州 有 
不 同 程度 的 缺陷 ,回归 模型 和 神经 网 络 模型 在 估算 
哈萨克 斯 坦 北 部 三 州 春小麦 产量 上 有 较 好 的 表现 。 
3.3 春小麦 估 产 精度 分 析 

植被 净 初 级 生产 力 NPP 通 常 乘 以 作物 收获 指 


春小麦 产量 相关 性 统计 结果 进行 分 级 (图 5) ,具体 
分 为 微弱 相关 (0.0~0.3) 、 低 度 相 关 (0.3~0.5) 显著 
相关 (0.5~0.8) 和 高 度 相关 (0.8~1.0)。 

研究 表明 ,在 北 哈萨克 斯 坦 州 ,回归 模型 、 a 
向 量 机 模型 和 神经 网 络 模型 相 比 随机 森林 模型 
够 更 好 的 预测 春小麦 产量 ， Soh eS AER 
森林 模型 , 低 度 相关 性 区 域 占 北 哈萨克 斯 坦 州 耕作 
区 近 68% ,显著 相关 区 域 占 比 仅 8%。 显 车 相关 区 主 
要 分 布 在 北 哈萨克 斯 坦 州 西部 和 东南 部 地 区 ,而 表 
现 为 低 度 相关 和 微弱 相关 区 域 主要 分 布 在 北 哈 萨 
克 斯 坦 州 的 北部 。 


202204.00100v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


HEWN 
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相关 性 分 级 相关 性 分 级 meta A 相关 性 分 级 
m 0.0~0.3 m 0.3~0.5 = 0.0~0.3 ~ 0.3~0.5 = 0.0~0.3 ~ 0.3~0.5 = 0.0~0.3 ~ 0.3~0.5 
m 0.5~0.8 E 0.8~1.0 m 0.5~0.8 Œ 0.8~1.0 m 0.3~0.8 E 0.8~1.0 m 0.5~0.8 E 0.8~1.0 
(ot) 网 克拉 州 pni MEREN (63) 阿 克 莫 拉 州 (b4) 阿 克 葛 拉 州 
回归 模 支持 向 量 机 模型 神经 网 络 模型 
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= ve — 一 MaR 一 一 
相关 性 分 级 相关 性 分 级 
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图 4 哈萨克 斯 坦 北部 估算 春小麦 产量 空间 验证 
Fig.4 Spatial validation of spring wheat yield estimation in northern Kazakhstan 
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图 5 NPP 与 春小麦 产量 相关 性 分 级 


Fig. 5 Classification of the correlation between NPP and spring wheat yield 


除 支持 向 量 机 模型 外 ,其 余 3 种 模型 在 阿 克 莫 。 量 相 关 性 都 在 0.5 以 上 。 表 现 最 佳 的 是 神经 网 络 模 
拉 州 都 得 到 了 很 好 的 验证 结果 ,尤其 是 回归 模型 和 型 , 佑 测 的 产量 与 NPP 显 著 相 关 和 高 度 相 关 占 比 总 
神经 网 络 模型 ,大 部 分 地 区 NPP 与 估算 的 春小麦 产 ”和 最 高 为 94% ,其 次 是 回归 模型 为 929% ,再 次 是 随机 
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森林 模型 为 77%。 从 空间 分 布 来 看 ,无论 是 高 产 区 
还 是 低产 区 ,回归 模型 神经 网 络 模型 和 随机 森林 
模型 预测 精度 都 较 好 ,对 于 了 解 该 地 区 高 产 和 低产 
田 的 分 布 位 置 和 产量 ,进而 合理 安排 该 地 区 的 农业 
生产 活动 具有 重要 的 参考 价值 。 

在 库 斯 塔 纳 州 ,回归 模型 .支持 向 量 机 模型 和 
神经 网 络 模型 模拟 的 精度 较 高 ,随机 森林 模型 模拟 
的 结果 不 理想 ,其 微弱 相关 占 比 为 23% ,主要 分 布 
在 库 斯 塔 纳 州 南部 地 区 ,而 其 他 模型 在 库 斯 塔 纳 州 
南部 地 区 表现 相对 较 好 ,大 部 分 区 域 相关 性 都 在 
0.50 以 上 。 而 在 库 斯 塔 纳 州 的 北部 地 区 ,4 种 模型 
佑 测 的 春小麦 产量 与 NPP 相关 性 表现 为 低 度 相关 ， 
而 根据 春小麦 产量 统计 结果 来 看 ,北部 区 域 实际 为 
库 斯 塔 纳 州 的 高 产 区 ,该 种 现象 与 北 哈萨克 斯 坦 州 
的 北部 佑 测 产量 验证 精度 较 低 具有 一 致 性 。 


4 讨论 


遥感 作物 佑 产 主 要 是 利用 遥感 影像 建立 表征 
作物 因子 与 产量 之 间 的 模型 体系 ,从 而 实现 对 作物 
产量 预测 ,可 使 用 单 植被 指数 或 者 多 植被 指数 组 
合 , 亦 可 与 影响 春小麦 产量 相关 的 气温 、 降 水 和 土 
培 肥力 等 因子 估算 春小麦 产量 “' ,但 使 用 多 因子 佑 
算 春 小 麦 产量 不 仅 对 样本 数据 量 有 要 求 ,同时 也 要 
考虑 多 因子 之 间 的 共 线 性 问题 ,在 样本 量 较 少 的 情 
况 下 ,使 用 多 因子 组 合 不 仅 不 会 提高 估 产 精度 ,而 
且 会 产生 较 大 偏差 。 

通过 利用 机 器 学 习 模型 和 回归 模型 估算 春 小 
麦 产量 发 现 ,各 模型 估算 的 春小麦 高 产 区 和 低产 区 
具有 极 大 的 相似 性 ,4 种 模型 在 北 哈萨克 斯 坦 州 佑 
测 产量 的 能 力 普 遍 较 差 ,尤其 是 在 北 哈萨克 斯 坦 州 
的 北部 地 区 ,该 地 区 是 春小麦 高 产 区 ,同样 的 现象 
也 发 生 在 库 斯 塔 纳 州 的 北部 ,经 过 对 降雨 数据 分 析 
以 及 地 面 调查 结果 发 现 , 该 地 区 雨量 较 大 ,对 MO- 
DIS 产品 数据 质量 造成 了 影响 ,也 有 可 能 是 由 于 验 
证 数据 MOD17A3HGF 产品 在 该 区 域 出 现 误差 ,还 
有 一 个 重要 原因 是 由 于 北 哈萨克 斯 坦 州 小 麦 的 种 
植 结构 比例 约 在 86% ,而 库 斯 塔 纳 州 和 阿 克 英 拉 州 
小 麦 种 植 比例 在 93% 以 上 ,在 北 哈萨克 斯 坦 州 有 大 
面积 的 大 麦 . 养 麦 和 土豆 种 植 ,不 能 完全 视 为 春 小 
麦 种 植 区 ,从 而 影响 估 产 模型 的 精度 。 

从 模型 角度 来 分 析 , 回 归 随 机 森林 模型 无 法 实 
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现 训练 数据 集 范围 外 的 预测 , 且 由 于 本 文 数据 样本 
量 较 小 ,在 进行 随机 采样 构建 回归 树 时 ,会 出 现 大 
量 相似 的 回归 树 ,并 且 高 产 和 低产 的 样本 有 时 不 会 
被 随机 抽 到 ,所 以 在 佑 测 产量 时 低产 或 高 产 的 区 域 
相 比 其 他 模型 偏 大 或 者 偏 小 。 支 持 向 量 机 模型 在 
寻求 结构 化 风险 最 小 的 方式 来 矫正 模型 汪 ,并 且 最 
终 决 策 函 数 只 由 少数 的 支持 向 量 所 决定 ,所 以 有 可 
能 将 几 个 中 度 产值 的 样本 数据 建立 超 平面 估算 作 
物产 量 , 导 致 估算 的 作物 产量 空间 差异 性 较 小 。 本 
文 发 现 , 在 样本 点 较 少 的 情况 下 ,双向 循环 神经 网 
络 和 回归 模型 更 加 可 靠 , 回 归 模 型 不 仅 可 以 节省 大 
量 机 器 学 习 进 行 模型 参数 优化 的 时 间 ,并 且 在 模型 
的 强健 性 上 不 输 于 机 器 学 习 模 型 ,但 回归 模型 的 可 
移植 性 不 高 ,从 模型 验证 的 整体 情况 来 看 ,机 器 学 
习 中 的 神经 网 络 模型 估算 精度 略 优 于 其 他 3 种 模 
型 。 由 于 缺乏 地 面 实测 产量 对 其 进行 验证 ,NPP 作 
为 表征 地 上 生物 量 的 重要 指标 ,尽管 MOD17A3HGF 
产品 在 某 些 区域 存 在 精度 限制 ,但 在 地 面 实测 数据 
缺乏 的 条 件 下 ,可 以 作为 验证 春小麦 产量 的 重要 数 


5 结论 


y 


(1) 除 NMDI 指 数 外 ,植被 指数 与 春小麦 单产 相 
关 性 较 强 的 时 间 段 主要 集中 在 6 月 26 日 一 5 月 5 日 
之 间 ,主要 是 因为 该 阶段 哈萨克 斯 坦 北 部 春小麦 进 
入 抽穗 扬花 到 逐渐 成 熟 时 期 ,是 春小麦 产量 形成 的 
关键 时 期 。 春 小 麦 估 产 最 优 植 被 指数 分 别 是 北 哈 
萨克斯 坦 州 7 月 12 日 CL, 阿 克 英 拉 州 为 8 月 5 日 
的 WDRVIsc, 库 斯 塔 纳 州 为 7 月 12 日 的 WDRVlo。o 

(2) 从 4 种 模型 模拟 的 春小麦 产量 空间 分 布 可 
知 , 模 型 模拟 的 产量 虽 有 差距 ,但 高 产 和 低产 的 分 
布 范围 具有 一 致 性 ,支持 向 量 机 模型 在 模拟 产量 时 
有 可 能 造成 产量 区 域 差距 较 小 ,而 随机 森林 模型 容 
易 出 现 高 产 区 或 者 低产 区 偏 大 或 者 偏 小 的 特点 , 回 
归 模 型 和 神经 网 络 模型 稳定 性 更 高 。 

(3) NPP 与 不 同 模型 估 测 的 春小麦 产量 进行 相 
关 性 分 析 ,结果 表明 ,在 阿 克 莫 拉 州 和 库 斯 塔 纳 州 ， 
最 佳 春 小 麦 估 产 模 型 为 神经 网 络 模型 ,其 次 为 回归 
模型 ,支持 向 量 机 模型 和 随机 森林 模型 精度 较 低 。 
而 在 北 哈萨克 斯 坦 州 ,4 种 模型 的 预测 精度 与 其 他 
二 州 相 比 相对 较 差 ,相对 而 言 , 双 向 循环 神经 网 络 


202204.00100v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


FHEWY 


模型 表现 最 佳 。 


参考 文献 (References) 


[1] 


[2] 


[B] 


[4] 


[5] 


[6] 


[7] 


[8] 


[9] 


[10] 


[11] 


[12] 


李宁 . 哈萨克 斯 坦 小 麦 产业 的 发 展 与 问题 中. 粮食 流通 技术 ， 
2013(2): 37-42. [Li Ning. Study on Kazakhstan’ s wheat industry 
and its problems[J]. Grain Distribution Technology, 2013(2): 37- 
42. | 

HBR, FET A). PULA EE a TFET]. 世界 农业 , 2014 
8): 22-26. [Ma Jun, Gong Xinshu. Research on food security in 
Central Asian countries|J]. World Agriculture, 2014(8): 22-26. ] 
周 清 波 . EASKE RK -S AREA). 中 国 农业 资源 与 
区 划 , 2004, 25(5): 12-17. [Zhou Qingbo. Status and tendency for 


development in remote sensing of agriculture situation|J]. Journal 
of China Agricultural Resources and Regional Planning, 2004, 25 
(5): 12-17. ] 

Anup K P, Lim C, Ramesh P S, et al. Crop yield estimation model 
for Iowa using remote sensing and surface parameters|J]. Interna- 
tional Journal of Applied Earth Observation and Geoinformation, 
2006, 8(1): 26-33. 

Michael S R. Assessment of millet yields and production in north- 
ern Burkina Faso using integrated NDVI from the AVHRRIJ]. In- 
ternational Journal of Remote Sensing, 1992, 13(18): 3871-3879. 
Michael S R. Operational yield forecast using AVHRR NDVI data: 
Reduction of environmental and inter-annual variability[J]. Inter- 
national Journal of Remote Sensing, 1997, 18(5): 1059-1077. 

焦 险峰 , 杨 邦 杰 , 裴 志 远 , 等 . 基于 植被 指数 的 作物 产量 监测 方 
法 研究 四. 农业 工程 学 报 , 2005, 21(4): 104-108. [Jiao Xianfeng, 
Yang Bangjie, Pei Zhiyuan, et al. Monitoring crop yield using NO- 


AA/AVHRR based vegetation indices[J]. Transactions of the Chi- 
nese Society of Agricultural Engineering, 2005, 21(4): 104-108. ] 
Tuvdendorj B. Determination of appropriate remote sensing indi- 
ces for spring wheat yield estimation in Mongolia[J]. Remote Sens- 
ing, 2019, 11(21): 2568-2570. 

李 军 玲 , 郭 其 乐 , iK. 基于 MODIS 数 据 的 河南 省 冬小麦 产 
量 遥 感 估 算 模 型 四. 生态 环境 学 报 , 2012, 21(10): 1665-1669. 


[Li Junling, Guo Qile, Peng Jiyong. Remote sensing estimation 
model of Henan Province winter wheat yield based on MODIS data 
[J]. Ecology and Environmental Sciences, 2012, 21(10): 1665- 
1669. | 

谭 昌 伟 . 基于 开花 期 卫星 遥感 数据 的 大 田 小 麦 估 产 方法 比较 
(J). 中 国 农 业 科 学 , 2017, 50(16): 3101-3109. [Tan Changwei. 


Comparison of the methods for predicting wheat yield based on sat- 
ellite remote sensing data at anthesis[J]. Scientia Agricultura Sini- 
ca, 2017, 50(16): 3101-3109. ] 

Uno Y. Artificial neural networks to predict corn yield from com- 
pact airborne spectrographic imager data[J]. Computers and Elec- 
tronics in Agriculture, 2005, 47(2): 149-161. 

TIEF, 王 修 信 . 多 植被 指数 组 合 的 冬小麦 遥感 估 产 方法 研究 


[13] 


[14] 


[15] 


[16] 


[17] 


[18] 


[19] 


[20] 


[21] 


(J). 干旱 区 资源 与 环境 , 2017, 31(7): 44-49. [Wang Kaining, 


Wang Xiuxin. Research on winter wheat yield estimtion with the 
multipy remote sensing vegetation index combination[J]. Journal of 
Arid Land Resources and Environment, 2017, 31(7): 44-49. ] 
REW. 基于 DSSAT 作物 模型 的 中 美 大 豆 主 产 区 单产 模拟 与 
iE [J]. 农业 工程 学 报 , 2021, 37(3): 132-139. [Xu Chunmeng. 


tt 


Simulations and validations of the soybean yields per unit area us- 
ing DSSAT crop model in the major soybean producing areas of 
China and America[J]. Transactions of the Chinese Society of Agri- 
cultural Engineering, 2021, 37(3): 132-139. ] 

赵 军 . 基于 净 初 级 生产 力 的 春小麦 生产 潜力 及 估 产 研究 一 一 以 
甘肃 省 白银 区 为 例 困 .干旱 地 区 农业 研究 , 2015, 33(1): 199- 


204. [Zhao Jun. Potential productivity and yield estimation of 


spring wheat based on a net primary production model: Taking Bai- 
yin District in Gansu Province as an example|J]. Agricultural Re- 
search in the Arid Areas, 2015, 33(1): 199-204. ] 

Bolton D K, Friedl M A. Forecasting crop yield using remotely 
sensed vegetation indices and crop phenology metrics|J]. Agricul- 
tural and Forest Meteorology, 2013, 173: 74-84. 

Leroux L. Crop monitoring using vegetation and thermal indices 
for yield estimates: Case study of a rainfed cereal in semi-arid west 
AfricalJ]. IEEE Journal of Selected Topics in Applied Earth Obser- 
vations and Remote Sensing, 2016, 9(1): 347-362. 

郭 锐 . 山东 省 冬小麦 单产 监测 与 预报 方法 研究 趾 . 农业 机 械 学 
报 , 2020, 51(7): 156-163. [Guo Rui. Monitoring and forecasting meth- 


od of winter wheat yield in Shandong Province[J]. Transactions of 


the Chinese Society for Agricultural Machinery, 2020, 51(7): 156- 


163. | 
KR. 长 春 地 区 玉米 产量 遥感 估算 方法 研究 [D]. KE: 吉林 大 


学 , 2018. [An Qin. Research on methods of maize yield estimation 
by remote sensing in Changchun region[D]. Changchun: Jilin Uni- 
versity, 2018. | 

曾 妍 , E, 赵 小 娟 , 等 . 基于 支持 向 量 回归 的 关中 平原 冬小麦 
fre WE FE (J). 中 国 农业 信息 , 2019, 31(6): 10-20. [Zeng Yan, 


Wang Di, Zhao Xiaojuan, et al. Study on yield prediction of winter 


wheat in Guanzhong Plain based on SVRIJ]. China Agricultural In- 
formatics, 2019, 31(6): 10-20. ] 

HERR, 马 鸿 元 , 田 丽 燕 , 等 . 基于 时 间 序 列 LAI 和 ET 同化 的 冬 
小 麦 遥 感 估 产 方法 比较 员 . 农业 工程 学 报 , 2015, 31(4): 197- 
203. [Huang Jianxi, Ma Hongyuan, Tian Liyan, et al. Comparison 


of remote sensing yield estimation methods for winter wheat based 
on assimilating time-sequence LAI and ET|J]. Transactions of the 
Chinese Society of Agricultural Engineering, 2015, 31(4): 197- 
203. | 

马 鸿 元 , 黄 健 照 , 黄海 , SE. 基于 历史 气象 资料 和 WOFOST 模 型 
的 区 域 产量 集合 预报 四 . 农业 机 械 学 报 , 2018, 49(9): 257-266. 


[Ma Hongyuan, Huang Jianxi, Huang Hai, et al. Ensemble fore- 


casting of regional yield of winter wheat based on WOFOST model 


using historical metrological dataset[J]. Transactions of the Chi- 


202204.00100v1 


chinaXiv 


[22] 


[23] 


[24] 


[25] 


[26] 


[27] 


[28] 


[29] 


[30] 


[31] 


PMR: 


nese Society for Agricultural Machinery, 2018, 49(9): 257-266. ] 

杨 练兵 , 郑 宏伟 , 罗 格 平 , 等 . 基于 遗传 算法 优化 BP 神 经 网 络 的 
HEED WEE MI]. 地 理 与 地 理 信息 科学 , 2021, 37(2): 21-37. 

[Yang Lianbing, Zheng Hongwei, Luo Geping, et al. Retrieval of 


soil salinity content based on BP neural network optimized by ge- 
netic algorithm[J]. Geography and Geo-Information Science, 2021, 
37(2): 21-37. ] 

Dara A. Mapping the timing of cropland abandonment and reculti- 
vation in northern Kazakhstan using annual Landsat time series[J]. 
Remote Sensing of Environment, 2018, 213: 49-60. 

Guo H. Determining variable weights for an optimal scaled drought 
condition index (OSDCI): Evaluation in Central Asia[J]. Remote 
Sensing of Environment, 2019, 231: 1-17. 

Yin H. Monitoring fire regimes and assessing their driving factors 
in Central Asia|J]. Journal of Arid Land, 2021, 13(5): 500-515. 
E K, 罗 格 平 , 白 洁 , 等 . 基于 多 期 数据 集 的 中 亚 五 国土 地 利 
用 /覆盖 变化 分 析 轴 . 干旱 区 地 理 , 2012, 35(6): 909-918. [Han 


Qifei, Luo Geping, Bai Jie, et al. Characteristics of land use and 


cover change in Central Asia in recent 30 years[J]. Arid Land Ge- 
ography, 2012, 35(6): 909-918. | 

Yao F. Estimation of maize yield by using a process-based model 
and remote sensing data in the Northeast China Plain[J]. Physics 
and Chemistry of the Earth, 2015, 87: 142-152. 

Mkhabela M S, Mashinini N N. Early maize yield forecasting in 
the four agro-ecological regions of Swaziland using NDVI data de- 
rived from NOAA’s-AVHRR{J]. Agricultural and Forest Meteorol- 
ogy, 2005, 129(1): 1-9. 
田 艳 君 , Oa, 帅 艳 民 , 等 . 基于 遥感 时 序 特征 的 地 表 覆 被 信息 
HE HJ]. 干旱 区 地 理 , 2021, 44(2): 450-459. [Tian Yanjun, Shi 


bi 


l 


Ying, Shuai Yanmin, et al. Land cover information retrieval from 
temporal features based remote sensing images[|J]. Arid Land Ge- 
ography, 2021, 44(2): 450-459. ] 

王 华 , i, 田 云 杰 , 等 . 基于 多 时 相 Landsat 影 像 的 中 亚 地 区 
植被 覆盖 遥感 监测 四 . 干旱 区 地 理 , 2020, 43(4): 1023-1032. 


[Wang Hua, Yang Qianpeng, Tian Yunjie, et al. Vegetation cover- 


age monitoring in the Central Asian countries using multi-tempo- 
ral Landsat images[J]. Arid Land Geography, 2020, 43(4): 1023- 
1032. | 

Jiang Z. Development of a two-band enhanced vegetation index 


without a blue band{J]. Remote Sensing of Environment, 2008, 112 


哈萨克 斯 坦 北部 小 麦 遥 


[32] 


[33] 


[34] 


[35] 


[36] 


[37] 


[38] 


[39] l 


[40] 


[41] 


ChinaXiv 合 作 期 刊 


至 感 估 产 方法 研究 


(10): 3833-3845. 

Gitelson A A. Wide dynamic range vegetation index for remote 
quantification of biophysical characteristics of vegetation[J]. Jour- 
nal of Plant Physiology, 2004, 161(2): 165-173. 

Gu Y. NDVI saturation adjustment: A new approach for improving 
cropland performance estimates in the Greater Platte River Basin, 
USA[J]. Ecological Indicators, 2013, 30: 1-6. 

Gitelson A A. Remote estimation of crop gross primary production 
with Landsat data{J]. Remote Sensing of Environment, 2012, 121: 
404-414. 

Gitelson A A. Remote estimation of canopy chlorophyll content in 
crops[J]. Geophysical Research Letters, 2005, 32(8): 1-4. 
Mirchooli F. Spatial distribution dependency of soil organic carbon 
content to important environmental variables[J]. Ecological Indica- 
tors, 2020, 116: 1-5. 

Jin Y. Remote sensing- based biomass estimation and its spatio- 
temporal variations in temperate grassland, northern ChinalJ]. Re- 
mote Sensing, 2014, 6(2): 1496-1513. 

EAA. SEP Dae E I KA WG SSH E A SD Sah A E 
生物 量 估 测 研究 [D]. 杭州 : 浙江 农林 大 学 , 2018. [Gao Yukun. 


Aboveground forest biomass estimation based on machine learning 


algorithms and multi-source data in a typical subtropical region 
[D]. Hangzhou: Zhejiang Agriculture and Forestry University, 
2018. | 

BERIS, 李 俊 明 , 刘 东 伟 , 等 . 基于 随机 森林 模型 的 城市 不 透水 
MRDA 以 呼和浩特 市 为 例 加 . 冰川 冻 土 , 2018, 40(4): 
828-836. [Gao Yanfang, Li Junming, Liu Dongwei, et al. Research 


on extraction of urban impervious surface based on random forest 
model: A case study in Hohhot|J]. Journal of Glaciology and Geoc- 
ryology, 2018, 40(4): 828-836. ] 

徐 新 刚 , 吴 炳 方 , 蒙 继 华 , 等 . 农作物 单产 遥感 估算 模型 研究 进 
Je (J). 农业 工程 学 报 , 2008(2): 290-298. [Xu Xingang, Wu Bing- 


fang, Meng Jihua, et al. Research advances in crop yield estima- 


tion models based on remote sensing[J]. Transactions of the Chi- 
nese Society of Agricultural Engineering, 2018(2): 290-298. ] 

PRI, 董 轩 妍 , 王 俊杰 . 4 种 机 器 学 习 模 型 反 演 太湖 叶绿素 a 浓 
度 的 比较 胡 . 水 生态 学 杂志 , 2019, 40(4): 48-57. [Xu Yi, Dong 


Xuanyan, Wang Junjie. Use of remote multispectral imaging to 
monitor chlorophyll-a in Taihu Lake: A comparison of machine 


learning models[J]. Journal of Hydroecology, 2019, 40(4): 48-57. ] 


202204.00100v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


FHEWY 


Wheat yield estimation with remote sensing in northern Kazakhstan 
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Abstract: Kazakhstan’ s flour export volume ranks first in the world and is called the Central Asian granary. Its 
northern regions, including North Kazakhstan, Aqmola, and Qostanay, are the world’s important wheat and flour 
exporters. The proportion of wheat planting structures has reached 86%. Since 2010, its wheat and barley output 
has ranked 12" in the world, and its export volume has ranked 5" in the world. However, the region is rain-fed and 
lacks effective irrigation measures. It often suffers from drought stress due to its location in the monsoon climatic 
zone, resulting in a large-scale reduction in spring wheat production, which severely restricts the economic 
development of countries that rely on wheat imports. The estimation of wheat production plays a vital crucial role 
in promoting regional food security and social stability, especially in responding to the food crisis in the post- 
epidemic era and achieving zero hunger advocated by the United Nations. In this paper, the rain-fed farming area 
in northern Kazakhstan is used as the research target area. An analysis of the optimal vegetation index for spring 
wheat yield estimation was conducted based on the statistical spring wheat yield and vegetation index. Various 
methods, such as regression, random forest, support vector machine, and neural network, are evaluated for the 
accuracy of wheat yield estimation. In North Kazakhstan, the best vegetation index for estimating spring wheat 
yield is the greenness chlorophyll index from 2007 to 2016. The forecast time can be advanced to July 12" from 
2007 to 2016. In Aqmola, the best vegetation index for estimating spring wheat yield is the greenness dynamic 
wide-band vegetation index (WDRV Lren). The forecast time can be advanced to August 5". In Qostanay, the best 
vegetation index for estimating spring wheat yield is the WDRVIseen. The forecast time can be advanced to July 
12". In this paper, MODIS NPP products are selected to verify the estimation results. Through correlation 
analysis with NPP shows that the neural network has higher accuracy in estimating spring wheat yield in the three 
northern states of Kazakhstan than other models. Neural networks accounted for 44%, 94%, and 77% of 
correlations in North Kazakhstan, Aqmola, and Qostanay states, respectively. 

Key words: rain-fed wheat farming area; remote sensing yield estimation; vegetation index; regression model; 


machine learning; northern Kazakhstan 


